8 research outputs found

    Implementazione di software per la gestione dei corpora LBC

    Get PDF

    Km4City Ontology Building vs Data Harvesting and Cleaning for Smart-city Services

    Get PDF
    Presently, a very large number of public and private data sets are available from local governments. In most cases, they are not semantically interoperable and a huge human effort would be needed to create integrated ontologies and knowledge base for smart city. Smart City ontology is not yet standardized, and a lot of research work is needed to identify models that can easily support the data reconciliation, the management of the complexity, to allow the data reasoning. In this paper, a system for data ingestion and reconciliation of smart cities related aspects as road graph, services available on the roads, traffic sensors etc., is proposed. The system allows managing a big data volume of data coming from a variety of sources considering both static and dynamic data. These data are mapped to a smart-city ontology, called KM4City (Knowledge Model for City), and stored into an RDF-Store where they are available for applications via SPARQL queries to provide new services to the users via specific applications of public administration and enterprises. The paper presents the process adopted to produce the ontology and the big data architecture for the knowledge base feeding on the basis of open and private data, and the mechanisms adopted for the data verification, reconciliation and validation. Some examples about the possible usage of the coherent big data knowledge base produced are also offered and are accessible from the RDF-Store and related services. The article also presented the work performed about reconciliation algorithms and their comparative assessment and selection

    Corpora e terminologia artistica: il caso del corpus spagnolo LBC

    Get PDF
    Il lessico relativo al patrimonio culturale italiano è oramai divenuto un ambito di interesse per molte discipline; a partire da tale considerazione, il progetto Lessico multilingue dei Beni Culturali (LBC) si pone l’obiettivo di analizzare e studiare la terminologia del mondo dell’arte in varie lingue, focalizzandosi in particolare sulla Toscana. Nell’ambito di tale lavoro di ricerca sono state realizzate varie banche dati contenenti testi letterari e tecnici con informazioni di rilievo sui beni culturali toscani al fine di diffonderne la conoscenza, mediante la pubblicazione online di corpora nelle lingue coinvolte nel progetto. Tra i risultati del progetto è da notare il corpus “Español LBC”, il quale dispone ad oggi di oltre un milione di parole, l’origine delle quali fa sì che il corpus sia caratterizzato da una alta frequenza di terminologia relativa all’arte, costituendo per questo un punto di riferimento per coloro che vogliono occuparsi di lessico spagnolo nell’ambito dei beni culturali. In particolare, lo scopo di questo paper è quello di descrivere il lavoro svolto nell’ambito della progettazione ed implementazione del corpus, e di analizzarne l’utilizzo per lo studio della terminologia spagnola dell’arte. Nell’ambito della terminologia spagnola dell’arte, come esempio delle possibilità di uso del corpus, verranno mostrate alcune tra le più significative unità pluriverbali, assenti nel dizionario utilizzato come riferimento

    Léxico español del arte documentado en el corpus LBC (Lessico dei Beni Culturali)

    No full text
    Esta publicación ofrece un lemario que da acceso a las concordancias extraídas del Corpus LBC (Lessico dei Beni Culturali). Incluye una amplia introducción metodológica que presenta los criterios con los que se ha elaborado el lemario y con los que se han analizado las concordancias, justificando también la elección de los diccionarios y de los corpus de referencia. El lemario recoge un repertorio de términos esenciales del ámbito del patrimonio artístico y cultural, con topónimos y antropónimos directamente relacionados con el arte italiano y florentino. Es una obra de consulta, que sin duda interesará a los investigadores del léxico especializado y que resultará muy útil para traductores y operadores culturales. El Corpus LBC español contiene más de un millón de palabras y constituye, junto a otros comparables en francés, italiano, alemán, inglés y ruso, el Corpora LBC. Está compuesto por textos de varias tipologías y géneros, en lengua original o traducidos, que van desde el Renacimiento hasta el siglo XX. Recoge obras clásicas del patrimonio artístico florentino e italiano como Las vidas de Giorgio Vasari y la Vida de Benvenuto Cellini, textos técnicos como Los quatro libros de arquitectura de Andrea Palladio, textos de autores no italianos como la Vida de Leonardo de Vinci de Raphaël Trichet du Fresne o Las mañanas en Florencia de John Ruskin, y obras de grandes autores que narran el Grand Tour en Italia como Viaje a Italia de Leandro Fernández de Moratín. La lista de las fuentes se presenta en la publicación. Al hacer clic en cada palabra del lemario se abre una ventana con la lista de las concordancias procedentes del Corpus LBC español, es decir, las citas de cada término encontradas en las fuentes que forman el corpus, seguidas de una sigla de referencia bibliográfica. Este lemario contiene unas 2000 palabras del léxico del arte y unas 10.000 concordancias en las que se ven sus contextos de uso
    corecore